В статье анализируется основная роль корпуса как многогранного лингвистического источника, то обстоятельство, что корпус в основном содержит информацию двух типов, и ее типы. В статье признается, что экономия времени, затрачиваемого на процесс анализа текста, возможность иллюстрировать особенности языковых единиц в речи тысячами примеров,являются основными эффективными возможностями корпуса. В области компьютерной лингвистики дается информация о национальном корпусе, учебном корпусе, параллельном корпусе. Было подчеркнуто, что лингвистическая, экстралингвистическая их маркировка, разработка алгоритма создания корпуса, создание лингвистической поддержки корпуса является социальной необходимостью. Признается актуальность разработки основы для создания корпуса узбекского языка, проведения исследований в области компьютерной лингвистики как научно теоретического источника.
В статье рассматривается язык в сети интернет, формирование языка компьютерных технологий как продолжение вычислительной лингвистики, ее уровни развития, особенности влияния языка на моделирование нового языка для искусственного интеллекта. Национальный корпус узбекского языка имеет большое значение для повышения международного статуса узбекского языка. Работа, выполняемая в области компьютерной лингвистики, играет важную роль в решении существующих проблем в узбекском языке. Статья основана на том, что значит строить национальный корпус, изучать тонкости слова в процессе обучения, на что опираться, чтобы развить способность использовать его в речи, какое значение имеет узбекский язык для науки и нации и кто может быть основным клиентом / пользователем узбекского языка. Основными пользователями корпуса являются, конечно же, лингвисты, которые работают в разных областях. Надежная статистическая информация о языке определенного периода привлекает также литературоведов, историков и других представителей гуманитарных наук. Национальный язык также важен в преподавании языка. Были высказаны мнения о технологическом процессе создания наци-онального корпуса. В частности, технологический процесс национального корпуса учитывает: создание словарного запаса лексемы и словоформы на основе выбранных текстов; возможность просмотра текста для любой единицы полученного сло варного запаса; разбивка графического слова на слоги; подбор слов; одновременная обработка неограниченного количества файлов, создание текстовых файлов с внешними символами.
В статье рассматриваются авторский корпус и его значение в современном глоссарии, мир пушкинского авторского корпуса, чешский писательский корпус, авторский корпус Шекспира и их недостатки. Интерфейс авторского корпуса состоит из различных конструкций и структур, и автор несет ответственность за его полноту, интерфейс должен быть привлекательным и впечатляющим. Создание интерфейса основано на дизайне национальных или современных функций, интерфейс должен включать жизнь и творчество художника в фотографиях. Корпус лингвистики — очень быстро развивающаяся отрасль мира компьютерной лингвистики, которая достигла больших успехов в этом отношении. Корпус лингвистики также преподается как наука в мировых университетах. Предметом этой дисциплины является теория и практика построения корпуса, такие как особенности тела и основы программирования. Корпус лингвистики занимается общей теорией и практикой компьютерной лингвистики, формированием языкового тела и компьютерными технологиями. В статье рассказывается о современных информационных технологиях, которые создали огромные возможности для языковой функциональности. Компьютерный перевод, редактирование, анализ, электронный словарь и тезаурус являются доказательством нашего мнения. Особенно создание современных электронных словарей и культуры их использования является одним из эффективных способов изучения языка. В частности, роль языковых зданий, созданных и развивающихся быстрыми темпами во всем мире при демонстрации способности и способности владеть языком, очень велика. Цель статьи — изучить лингвистические основы корпуса узбекского языка, изучить
лингвистическую ценность лингвистического корпуса, историю корпусного языкознания, изучить авторскую лингвистику корпусов, ее особенности в социальном, лексикологическом, образовательная и другие сферы.
В статье рассматривается трансформация языка в язык Интернета, компьютерные технологии, математическая лингвистика, ее продолжение и становление и развитие компьютерной лингвистики, в частности вопрос моделирования естественных языков для искусственного интеллекта. В частности, исследуется вопрос лингвистического и экстралингвистического разделения специальных тегов для маркировки текстов и их компонентов. Определены требования к кодированию важной текстовой информации. В статье рассматривается основное назначение корпуса как сложного лингвистического источника, а также тот факт, что он в основном содержит два вида информации и ее типы. Национальный корпус, образовательный корпус и параллельный корпус обсуждаются в рамках предмета компьютерной лингвистики. Было подчеркнуто, что их лингвистическая и экстралингвистическая маркировка, разработка алгоритмов формирования корпусов и создание корпусной лингвистической поддержки являются общественной потребностью.
Мақолада корпуснинг кўп қиррали лингвистик манба сифатидаги асосий аҳамияти, корпус асосан икки турдаги маълумотга эга эканлиги ҳамда унинг турлари таҳлил қилинган. Лексик грамматик кодни шакллантириш мақсадида фонологик, морфонологик ва орфографик қоидалар алгоритми зарурияти илмий асосланган. “Эксперт лингвистик тизим" корпус-менежер тизими ва унинг асосий имкониятлари айтиб ўтилган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда фонологик, морфонологик ва орфографик каби лингвистик модулларнинг аҳамияти, корпусда асосий структурали бирликларни ажратиш ёритилган.
В данной статье автор акцентирует внимание на географических особенностях, украшении и форме сфероконусов, широко распространенных в мусульманских странах. Объясняя резко расходящиеся научные мнения исследователей о его функции, он пытается представить точную функцию сосудов на основе четких экспертных данных
The article discusses the author's corps and its significance in modern glossary, the world of Pushkin's author's corps, the Czech writer's corps, Shakespeare's author's corps and their shortcomings. The interface of the author's corps is made up of different designs and structures, and the author is responsible for its completeness, the interface should be attractive and impressive. The creation of the interface is based on the design of the national or modern features, the interface should involve the life and works of the artist in photoes. The Corpus of Linguistics is a very rapidly developing branch of the world of computational linguistics, which has achieved great success in this regard.
The Corpus of Linguistics is also taught as a science in world universities. The subject of this discipline is the theory and practice of building a corpus, such as body features and the basics of programming. The Corpus of Linguistics deals with general theory and practice of computational linguistics, the formation of the language body, and computer technologies. The article tells about modern information technologies that have created tremendous opportunities for language functionality. Computer translation, editing, analysis, electronic dictionary and thesaurus are proof of our opinion. Especially the creation of modern electronic dictionaries and the culture of their use is one of the effective ways of learning a language. In particular, the role of language buildings created and developing at a fast pace throughout the world when demonstrating the ability and ability to master the language is very large. The purpose of the article is to study the linguistic foundations of the Uzbek language corpus, to study the linguistic value of the linguistic corpus, the history of corpus linguistics, to study the author's linguistics of the corpuses, its features in the social, lexicological, educational and other fields.
The article gives an idea about the interface, the content of the corpus, its flawless functioning and at first glance the importance of the author’s personality, creative heritage, classification.
Монография ўзбек миллий шевалари корпусини тузишнинг лингвистик асослари Бойсун тумани “ж”ловчи шевалари мисолида ёритилган. Ўзбек миллий субшевалар корпусининг базавий структурасига оид назариялар ҳамда амалиётдаги статистикаси келтирилиб ўтилган.
Шунингдек ўзбек миллий мавзувий шевалар корпусининг матн, паспорт, жанр, мавзувий метаразметкаси ва унинг конструктив концепцияси оид қарашлар назарий ва амалий асосланган.
Китоб тилшунослар, диалектолог ва корпус лингвистикаси доирасида тадқиқот олиб борувчилар ва амалий филология талабалари учун мўлжалланган.
В данной статьи автором проводится анализ институт «Хабеас корпуса» в уголовно-процессуального законодательстве Республики Узбекистан и перспективы его развития. В частности в статье приведены несколько предложений по развитию институт «Хабеас корпуса» в уголовно-процессуального законодательстве Республики Узбекистан.
Мақолада сўз ясалиши ва унинг тарихи билан боғлиқ маълумотлар таҳлил этилган. Ушбу мақолада лингвистик дастурларнинг мустақил таркибий қисмларидан бир лингвистик модул ва алгоритм ҳамда унинг турлари таҳлил қилинган. Лексик-грамматик кодни шакллантириш мақсадида қўшма сўз ясалиши қоидалар бўйича алгоритм зарурияти илмий асосланган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда қўшма сўзнинг лингвистик модулларининг аҳамияти ёритилган.
The article discusses the types of interfaces and the importance of the search window of the corpus in the creation of the national corpus of the Uzbek language. The interface of the national corpus consists of various designs and structures, the author is responsible for their completeness, the interface should be attractive and effective. The creation of the interface is based on national or modern features, and the interface should focus on the national color. Linguistic corpora are a very fast-growing branch of the world of computational linguistics that has achieved great success. An interface is a communication system between a technology and a user. Interface types such as visual, gestural and linguistic were analyzed.
Мақолада сўз ясалиши ва унинг тарихи билан боғлиқ маълумотлар таҳлил этилган. Ушбу мақолада лингвистик дастурларнинг мустақил таркибий қисмларидан бир лингвистик модул ва алгоритм ҳамда унинг турлари таҳлил қилинган. Лексик-грамматик кодни шакллантириш мақсадида қўшма сўз ясалиши қоидалар бўйича алгоритм зарурияти илмий асосланган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда қўшма сўзнинг лингвистик модулларининг аҳамияти ёритилган.
В статье анализируется лингвистический модуль и алгоритм и его типы из независимых компонентов лингвистических программ. Необходимость в алгоритме фонологических, морфологических и орфографических правил для формирования лексико-грамматического кода научно обоснована. Подчеркивается важность таких лингвистических модулей, как фонология, морфология и орфография, в формировании лингвистической базы национального корпуса узбекского языка.
В статье анализируется лингвистический модуль и алгоритм и его типы из независимых компонентов лингвистических программ. Необходимость в алгоритме фонологических, морфологических и орфографических правил для формирования лексико-грамматического кода научно обоснована. Подчеркивается важность таких лингвистических модулей, как фонология, морфология и орфография, в формировании лингвистической базы национального корпуса узбекского языка.
Тадқиқот мавзусининг долзарблиги ва зарурати. Жаҳон тилшунослигида рақамли ахборот воситаларидан фойдаланиш қулайлиги ҳамда интернет орқали миллий тилларни ўзлаштиришга бўлган ҳаракат таъсирида миллий корпусларда шевалар базасини яратиш тенденцияси ўсмоқда. Натижада тилда мавжуд диалектларни нафақат лингвистик, балки амалий жиҳатдан тадқиқ этиш, бу орқали шева бирликларини сақлаб қолиш, авлоддан-авлодга етказиш имкониятининг кўлами кенгаймоқда: миллий тил корпусларида шева бирликларини лингвистик аниқлашнинг умумий тамойилларини ўрганиш, шевалар корпусининг жанрлар бўйича метаразметкасини ишлаб чиқиш, диалектал транскрипция лингвистик таъминоти тизимини ишлаб чиқишнинг амалий аҳамияти ошмоқда. Ҳозирда шева бирликларини матнга кўчириш (ёзиб олиш) асосига қурилган диалектал корпусларнинг икки хил йўналишли: мавзувий ва тегланган матнли корпусни шакллантириш муаммолари долзарб бўлиб қолмоқда. Дунё тилшунослигида тилларни сунъий интеллект ёрдамида матн таркибида сақлаб қолиш орқали уларнинг яшовчанлигини узайтириш ва лингвистик корпуснинг субкорпуси – шевалар корпусини шакллантириш зарурияти кун тартибидаги масалалардан бири ҳисобланди. Жумладан, диалектларни бир жойга жамлаш, таркибий тартиблаштириш, шевашуносликда мавжуд манбаларнинг сониялар оралиғида сараланиши ҳамда тақдимотини йўлга қўйиш доирасида: Австрия, Хитой (Мандарин диалектлари корпуси), Германия, Португалия, Чехия, Финляндия, Скандинавия, Польша, Литва, Грузия (масалан: Cor-Dial-Sin; Helsinki corpus of English dialeсts; Nordic dialeсts corpus; Archiv fur gesprochenes Deutsch, Die bayerische Dialektadebank; LEXDIALGRAM ва ҳ.к.), Россиянинг Москва, Славян-Кубан, Вологод, Саратов, Қозон диалектал корпуслари, Санкт Петербург илмий-текшириш институтлари, Томск диалектологик корпус мактабларида амалга оширилаётган тадқиқотларни кўрсатиб ўтиш мумкин.
Ўзбек тилшунослигида корпус лингвистикасига доир яқин йиллар оралиғида бажарилган тадқиқотлар тилни ўрганувчи ва уни тадқиқ этувчилар учун асос вазифасини ўтай бошлагани унинг истиқболли йўналиши эканини яна бир бор исботлаб берди. Бинобарин, “...давлат тилининг софлигини сақлаш, уни бойитиб бориш ва аҳолининг нутқ маданиятини ошириш; давлат тилининг замонавий ахборот технологиялари ва коммуникацияларига фаол интеграциялашувини таъминлаш 1 ” ҳозирги кунда ўзбек компьютер лингвистикаси олдида турган долзарб вазифалардан биридир. Ўзбек шевашунослигида шевалар корпусининг лингвистик базасини яратиш, ўзбек шевашунослиги муаммоларини амалий тилшунослик тамойиллари асосида тадқиқ этиш имкониятларини кенгайтириш ва шу орқали шева корпусини яратишнинг лингвистик асосларини назарий асослаш, белгилаш ва ишлаб чиқиш бугуннинг муҳим масалаларидандир. Бунда ўзбек тили шевалари корпусини шакллантириш орқали унинг компьютер услуби, шеваларнинг хорижий тилларга таржима дастурлари ва луғатлар, электрон дарсликлар яратиш билан боғлиқ илмий методик ишланмалар, амалий тавсиялар тайёрлаш ва бу орада эришилган натижаларни амалиётга кенг татбиқ этиш ҳар жиҳатдан долзарбдир.
Ўзбекистон Республикаси Президентининг 2017 йил 7 феврал “Ўзбекистон Республикасини янада ривожлантириш бўйича Ҳаракатлар стратегияси тўғрисида”ги ПФ–4947-сон, 2019 йил 21 октябр “Ўзбек тилининг давлат тили сифатидаги нуфузи ва мавқейини тубдан ошириш чора-тадбирлари тўғрисида”ги ПФ–5850-сон Фармонлари, 2017 йил 17 февраль “Фанлар академияси фаолияти, илмий тадқиқот ишларини ташкил этиш, бошқариш ва молиялаштиришни янада такомиллаштириш чора-тадбирлари тўғрисида”ги ПҚ–2789-сон ва 2019 йил 4 октябр “Ўзбекистон Республикасининг “Давлат тили ҳақида”ги Қонуни қабул қилинганлигининг ўттиз йиллигини кенг нишонлаш тўғрисида”ги ПҚ–4479-сон Қарорлари мазкур фаолиятга тегишли бошқа меъёрий-ҳуқуқий ҳужжатларда белгиланган вазифаларни амалга оширишга ушбу диссертация тадқиқоти муайян даражада хизмат қилади.
В этой статье исследованы арабские заимствования в поэме «Хайрат ул-аброр» («Смятение праведных») основоположника узбекского языка, поэта мирового значения Алишера Навои. С этой целью, нa основе конкорданса «частотного словаря» выявлено употребление 2838 лексем и словосочетаний арабского происхождения. В том числе имеются 52 цитаты из Корана и сказаний пророка, которые не адаптированы в систему литературного узбекского языка. Примерно 90% арабских заимствований прошли процесс адаптации в литературном узбекском языке до Навои и употребляются до сих пор. Остальные 10% не вошли в состав словарного фонда узбекского языка и употребления по необходимости арабской системы стихосложения "аруз" и рифмы. Поэт составил специальный словарь арабских лексем «Сабъати абхур» («Семь океанов»), для того чтобы использовать в стихах по необходимости. Ещё один признак полной адаптации арабских заимствований – это сложные и аффиксальные слова, составленные по модели «арабско-персидские», «арабско-тюркские» их морфологическим и синтаксическим правилам узбекского языка.
The article analyzes information about word formation and its history. This article analyzes the linguistic module and algorithm, as well as its types from independent components of linguistic programs. The need for an algorithm based on the rules of compound word formation for the formation of a lexico-grammatical code is scientifically substantiated. The importance of language modules of a complex word in the formation of the linguistic base of the national corpus of the Uzbek language is emphasized.